Choix d'une mesure de proximité discriminante dans un contexte topologique
نویسندگان
چکیده
Résumé. Les résultats de toute opération de classification ou de classement d’objets dépendent fortement de la mesure de proximité choisie. L’utilisateur est amené à choisir une mesure parmi les nombreuses mesures de proximité existantes. Or, selon la notion d’équivalence topologique choisie, certaines sont plus ou moins équivalentes. Dans cet article, nous proposons une nouvelle approche de comparaison et de classement de mesures de proximité, dans une structure topologique et dans un objectif de discrimination. Le concept d’équivalence topologique fait appel à la structure de voisinage local. Nous proposons alors de définir l’équivalence topologique entre deux mesures de proximité à travers la structure topologique induite par chaque mesure dans un contexte de discrimination. Nous proposons également un critère pour choisir la "meilleure" mesure adaptée aux données considérées, parmi quelques mesures de proximité les plus utilisées dans le cadre de données quantitatives. Le choix de la "meilleure" mesure de proximité discriminante peut être vérifié a posteriori par une méthode d’apprentissage supervisée de type SVM, analyse discriminante ou encore régression Logistique, appliquée dans un contexte topologique. Le principe de l’approche proposée est illustré à partir d’un exemple de données quantitatives réelles avec huit mesures de proximité classiques de la littérature. Des expérimentations ont permis d’évaluer la performance de cette approche topologique de discrimination en terme de taille et/ou de dimension des données considérées et de sélection de la "meilleur" mesure de proximité discriminante.
منابع مشابه
Sélection topologique de variables dans un contexte de discrimination
Résumé. En apprentissage automatique, la présence d’un grand nombre de variables explicatives conduit à une plus grande complexité des algorithmes et à une forte dégradation des performances des modèles de prédiction. Pour cela, une sélection d’un sous-ensemble optimal discriminant de ces variables s’avère nécessaire. Dans cet article, une approche topologique est proposée pour la sélection de ...
متن کاملEquivalence topologique entre mesures de proximité
Résumé. Le choix d’une mesure de proximité entre objets a un impact direct sur les résultats de toute opération de classification, de comparaison, d’évaluation ou de structuration d’un ensemble d’objets. Pour un problème donné, l’utilisateur est amené à choisir une parmi les nombreuses mesures de proximité existantes. Or, selon la notion d’équivalence choisie, comme celle basée sur les préordon...
متن کاملSEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémiotique
Cet article propose une nouvelle mesure de similarité conceptuelle baptisée SEMIOSEM (Semiotic-Based Similarity Measure). La première originalité de cette mesure est de prendre en compte les trois dimensions sémiotiques de la conceptualisation sous-jacente à une ontologie de domaine : l’intension (i.e. les propriétés utilisées pour définir les concepts et la structure de la hiérarchie de subsom...
متن کاملCRIM: un module de corrélation d'alertes et de réaction aux attaques
Avec le besoin grandissant de protéger les systèmes d’informations, la détection d’intrusion constitue une démarche intéressante mais encore très imparfaite. Il y a actuellement deux approches principales de la détection d’intrusions : l’approche comportementale et l’approche par détection de scénarios. Aucune de ces approches n’est complètement satisfaisante. Elles génèrent souvent de trop nom...
متن کاملSous-bases k-faibles pour des règles d'association valides au sens de la confiance
L’un des problèmes majeurs rencontrés dans la fouille des règles d’association valides au sens de la confiance est le nombre souvent très élevé de ces règles. Plusieurs solutions à ce problème ont été proposées ou considérées dans la littérature. Parmi ces solutions figurent les bases, c’est-à-dire, des familles génératrices minimales (Zaki et Ogihara, 1998; Pasquier et al., 1999). La plupart d...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2015